百度李忠刚 | 人工智能时代的知识产权
发言人:李忠刚
百度专利事务部 高级专利顾问
感谢垦丁组织这么一个平台!
我想先做一个调查,咱们在座的同志们有多少人是专注于专利工作的,请举手。这比例大概有到1/6,考虑到大多数同志可能还是做通用法务的,所以我尽量不把今天的话题过多深入到专利实务的细节里面。我个人一直在做专利方面工作,所以我所讲的内容不可避免地会更多地集中在专利这个话题上。
今天的题目是人工智能时代的知识产权,这个知识产权主要涉及的是专利。大家看这张照片,这是前一段美国一个杂志的封面图,封面故事是从中国制造到中国速度的转变,选用了百度的Apollo自动驾驶汽车作为中国速度的一个例子。在这样一辆跑在美国加州公路上的实际道路测试车后面的支撑是什么?是超过十六万行的代码,这些代码都是开源的,我们在全球有超过100个合作伙伴加入我们的开源生态。在这背后我们有数百个非常重要的核心技术专利。而百度其实只是整个中国高科技产业的一个例子。
下面我们就来看一下中国的高科技产业。这张图中是一个增长非常强劲的曲线,这是这十年里中国高科技产业产值的一个变化,2013年的产值达到了3万亿,这是什么概念?是起始状态2008年的百倍数量级。2017年的产值更是到了5万亿。而与此同时,这个红色的柱状图是我们中国的专利申请量,大家可以看到,专利申请量的增长趋势与中国高科技产业的产值是相当吻合的。前段时间世界知识产权组织(WIPO)的管理层来百度调研和交流,他们对这个数据印象特别深刻,特别认同这个例子所代表的意义,那就是高科技产业和专利之间有很强相关性。
在这样一个趋势下,我们把中国的知识产权的变化划分了三个时代。
第一个时代就是PC时代,PC时代大家都是坐在电脑前面,使用场景差异性不大,所以那个时候主要是本土企业的同质化竞争。我们的知识产权工作也是刚刚起步,大多数企业还是在冲量,那个时候知识产权对于企业的主要作用是什么?就是一个品牌价值,我专利多,证明我技术好,我公司靠谱。所以当时的专利积累其实更多是在被动地响应业务部门的需求,是每个企业各自为战,单一储备。
随着时代发展,咱们进入了移动互联网时代,这个时候我们可以随时随地使用互联网,场景的差异化出现了,我们的竞争开始变成了本土企业的差异化竞争。而知识产权也蓬勃发展,大家不光积累量,也开始重视质。这个时候因为竞争的激烈化,很多互联网公司之间的诉讼开始使用专利这个工具来进行攻防,所以专利的竞争价值就体现了出来。在积累专利的时候,知识产权部门开始变得更加主动地去沉淀专利,但是总体而言,各个企业依然是在基于自身的研发成果来积淀专利,我们管它叫单一储备。
现在,我们来到了AI时代。AI时代一大特点就是竞争全球化,举一个例子,很多人工智能初创公司刚刚成立,就会同时在北京设立一个办公室,在硅谷设立一个办公室,国别限制被弱化了,竞争变得全球化。为了应付这样全球化的竞争,专利的质量变得前所未有地重要,专利需要不仅在中国布局,还要在海外布局。
而这个时候,因为要面对很多国际化巨头的竞争,要关注这些国际化巨头的动向,专利的情报价值被凸显出来,我们从专利信息中可以得到越来越多的情报。后面我会给大家举几个专利情报的具体例子。而这个时代,专利布局越来越主动,越来越超前,我们不光要利用自己的技术积累来布局专利,还要进一步构建生态。AI时代,在专利方面的沉淀开始呈现出合纵连横的趋势,后面我也会给大家举两个今年刚刚发生的例子。
针对AI时代,我们总结出如下几个特点:
人机交互,其实人机一直在交互,但是过去是我们人去适应机器,我们学习键盘指法,我们利用鼠标等各种方式让机器理解我们的指令。但是AI时代的方向是让机器去主动理解人,我们仅仅对机器说一句话,剩下的就是让机器去理解我们想干什么。
此外,在AI时代,算法是核心,但是这个算法要以计算能力和数据作为基础。我们的算法需要通过大数据进行训练才能形成一个可用的模型,而这样的一个计算过程需要一个海量的计算能力支持。而对于一个训练好的模型来说,关键是要把它应用落地,用到具体场景中,才能够跟人来交互,才能够实现一项实用的功能。
AI时代依赖互联网,但是不止局限于互联网,无论是大数据,还是数据的计算量,都是需要互联网支撑,但是AI涵盖了一个更大更广阔的前景。
还有一点就是跨界,以往硬件生产商的生产出标准化的通用硬件,软件生产商来利用这个硬件来实现想要的功能。但AI时代,硬件和软件,从开发过程伊始就互相融合,同时各种跨产业都在将AI应用到各种各样的场景。
最后一点,AI时代是一个技术驱动的时代,而技术驱动就意味着需要开源和开放。闭门造车,一家企业单独去搞技术,即便起点特别高,但是也比不上一个生态或一个社区共同来改进所能达到的高度。技术在AI时代的重要性是前所未有地高。
下面讲一下百度的AI技术。
前面说了AI的重点是数据、算法和计算能力,而这正是我们百度所提出的人工智能分层中最基础的一层。
第二层叫感知,就是说我们要让机器能从现实世界中提取出信息来,无论是语音、图像、视频还是增强现实、虚拟现实。增强现实和虚拟现实技术,不光是在向用户呈现信息,同时也包括获取来自用户的反馈,从而形成一个闭环。
获取这些信息之后,上面就是认知层。例如,自然语言处理就是我要理解你说这话什么意思,知识图谱就是我们要理解词汇和词汇之间代表的知识的内在关联。比如我在语言处理的结果中识别出了Angela baby和杨颖,AI要通过知识图谱理解到,这不是两个人的名字,而是一个人的不同名字。此外,用户画像指的是,AI要通过各种各样的数据理解用户,而不是对所有用户都提供同样的信息反馈。不同的用户群组都会得到不同的信息反馈,所谓千人千面。
再向上一层就是百度的开放平台,百度的AI开放平台可以供所有人开放访问,上面提供了开放各种各样的人工智能能力,这个平台集成了我们提到过的各种技术。通过这个开放平台,避免了是用A技术得到的输出,无法被B技术用作输入。这些技术被整合起来成为一个平台。
最终,在最上面的应用层,这个平台所整合起来的技术被用到具体场景里面。比如后面我要讲到百度的自动驾驶,还有百度的DuerOS交互系统。
首先是百度的Apollo计划,也就是自动驾驶的开源项目。
先讲这个小故事,左侧图片里是2015年的乌镇互联网大会,总书记看了我们的自动驾驶无人车,很感兴趣。当时主办方规定总书记在每个展台待三分钟,可在百度展台,总书记问了李彦宏很多问题,最后用了13分钟,使得百度展台成为停留时间最长的展台。
右侧图片是去年年底的时候科技部的一个文件,文件中提及依托百度公司建设自动驾驶的国家新一代人工智能开放创新平台。很多媒体因此称百度是自动驾驶国家队,但从我个人角度,我更看重开放创新的这几个字,非常契合百度的自动驾驶开源生态。
举个例子,如果有个公司说想做一个无人的洒水车,那么可以直接在百度Apollo平台上找到自动驾驶如何控制车辆、如何转向的代码。这个公司利用开源代码,可以节省出资源去专注于实现洒水功能。百度通过这样的开源,可以促进自动驾驶技术更快的发展,在各个领域上的应用。大家不用再重新做一遍百度做过的功能,因为百度将其通过开源的方式贡献出来了。
第二个例子叫DuerOS系统。这个DuerOS是一种人机交互系统,使得你直接用语音就可以跟机器完成交互。这套系统也是在构建生态,如图上所示的生态布局版图。这个版图的很多合作伙伴,其实也是我们今天演讲的嘉宾,比如小米。
在这个生态布局下,我们现在已经取得了相当辉煌的成就,比如整个生态有160余家合作伙伴,目前DuerOS系统已经搭载了91款产品。仅在3月份,DuerOS就响应了超过2亿次语音搜索的需求,此外,百度前不久推出的小度在家智能音箱,刚刚在上海的亚洲CES上得到了最佳智能家居产品的奖项。
而这个图表明了百度在人工智能专利方面的工作。这是在国内公开的人工智能专利数量,红的是百度,蓝色的是若干国际巨头和一些国内竞争伙伴的申请量。可能会有人说这样的对比不太公平,因为中国是百度的主场,是外国巨头的客场。但是我要说的是,百度在国外的专利申请数量也已经达到了数千件。
下面是我们对人工智能时代专利工作特点的理解。第一个特点就是人工智能的知识产权竞争是全球化的,大家可以看到下面这个图,在人工智能方面的专利数量,美国排在第一,26000,中国排到第二,15700。也就是说,在人工智能领域的知识产权格局上,中国从一开始就是在牌桌上的玩家,不像以前的大多数领域,我们都是后来的追赶者。
但同时要注意到一个特别重要的趋势,就是欧洲追赶得非常厉害。举一个例子,德国有个汽车供应商叫做德尔福,德尔福在去年将自己直接拆分为德尔福科技和安波福两个企业,其中安波福专注于人工智能相关的汽车配件,比如各种自动驾驶系统,人机交互系统。人们常说,壮士断腕,而这家德国企业为了让自己能赶上人工智能的发展,直接把自己腰斩,何等魄力!
第二个特点就是刚才我提到的专利情报价值。这个专利是谷歌公开的最早的一份自动驾驶专利。而这第二个专利是谷歌公开的第一份关于出行服务领域的专利。大家注意这个时间是2016年年底,很快,2017年年初,谷歌优步的那个官司就冒出来了,当时我们就看到了谷歌介入出行服务领域的野心。在谷歌跟优步之间的关系变僵之后,谷歌必然定会寻求跟其他优步的竞争对手去合作,而当时美国市场优步排第一,Lyft排第二。
果然,在2017年5月份,谷歌和Lyft达成了深度的合作。对于我们关注专利情报的人来说,这个新闻其实已经是预料之内,这充分体现了专利的情报价值。专利情报价值的另外一个体现是这张图,这是我们关注的一个自动驾驶企业。纵向轴是自动驾驶的各种技术细分领域,横向轴是时间轴。
这个公司的申请量在不同的技术细分领域趋势是不一样的,有些技术领域慢慢地不再申请了,说明这个领域的技术被淘汰掉了或者已经走向饱和了。某些领域申请量一直很大,说明是一个非常重要的支柱性技术领域,有些领域在最近一两年申请量突然增加,说明这是一个新的热点。这些信息对我们研发部门来说特别重要,可以帮助研发部门少走很多的弯路。
下面是第三个特点,就是专利战的前移。刚才我们谈到移动互联网时代,市场竞争激烈后专利被拿出来当做攻防武器。但是在AI时代,自动驾驶这个技术还没有成熟落地,但是专利方面的纠纷就已经开始了。我刚才提到的谷歌和优步之间的涉及专利的纠纷,今年2月份已经得出了一个结果,特别有戏剧性,双方和解了。和解的内容是优步拿出自己0.56%的股份送给谷歌,大概价值16亿人民币,而谷歌不再追究这件事情。换言之,谷歌最后倒成为了优步的股东。
最后一项是合纵连横,在这里讲两个例子。一个例子是腾讯今年1月份跟谷歌达成了专利交叉许可,这个许可的范围涵盖非常广,某种意义上走在了具体产品业务合作之前。另外一个例子是滴滴收购了一个无人驾驶的专利包,这也验证了我们前面提到的、专利积累变得不仅仅依靠自己的研发,在市场上的收购也成为了专利积累的重要途径。也许有人会说,花钱买不是很容易嘛。但是对于购买专利,从专利的评估分析到最后价格的谈判,其实是一件高度专业化的工作。
以上就是我的分享,AI时代,百度更懂你,谢谢大家!
------------
网络法实务圈将陆续发布各位嘉宾在2018年网络法实务大会上的演讲实录,敬请关注!
------------
另外,您还可以查阅首届,即2017年网络法实务大会嘉宾的精彩演讲实录(部分)
主编:麻策
责任编辑:Zoey
图片摄影:高兴就好工作室